
Google 最新開源人工智慧模型 Gemma 4 已正式亮相,主打在智慧型手機等裝置上本地運行,可處理文字、圖像與音訊,並支援代理功能,最重要的是資料全程不外洩,大幅強化用戶隱私,且模型運算速度比前代快上四倍。
Google 今日發表其開源人工智慧模型 Gemma 4,強調此模型可完全在手機等終端裝置上執行文字、圖像及音訊處理,大幅提升用戶隱私保護,確保資料不會外洩。Gemma 4 具備自主運用工具的能力,例如透過內建的代理功能來使用維基百科、互動地圖或二維碼生成器。
這款新模型家族包含適用於智慧型手機的 E2B 與 E4B 變體,分別僅需 6GB 與 8GB 的隨機存取記憶體(RAM)。Google 聲稱 Gemma 4 的運算速度比前一代快上四倍,在 Android 裝置上能將電池消耗降低多達 60%。為實現最佳化,Google 與 Arm 及 Qualcomm 合作,針對當前的行動晶片進行了優化。Arm 的基準測試顯示,搭載具備 SME2 指令集的新一代 Arm 晶片裝置,處理速度平均提升 5.5 倍。
Gemma 4 承襲 Google 專有模型 Gemini 3 的研究基礎,所有 Gemma 4 模型均支援超過 140 種語言的文字、圖像及音訊處理。自第一代推出以來,Gemma 系列模型已累積逾 4 億次下載。Google 以商業友善的 Apache 2.0 授權條款發布 Gemma 4,鼓勵開發者透過 GitHub 創建並分享客製化功能。用戶可透過 Android 及 iOS 平台上的免費「Google AI Edge Gallery」應用程式運行 Gemma 4 模型,該應用程式在 Gemma 4 發布後不久,便在 iOS App Store 的免費生產力應用程式排行榜中躍居第四。
Gemma 4 的智慧手機版本 E2B 和 E4B 也將成為 Android 下一代系統級端側模型 Gemini Nano 4 的基石,預計在今年稍後隨同新款旗艦裝置一同問世。Google 曾在去年 12 月預覽 FunctionGemma 模型,這是一款具備 2.7 億參數的本地模型,能將自然語言指令導向其他手機應用程式,實現例如開啟手電筒、建立聯絡人或設定行事曆等功能。
值得一提的是,Apple 已與 Google 達成數十億美元的協議,自今年一月起便已知悉 Apple 下一代基礎模型將採用 Google 的 Gemini 技術,並已於 2025 年期間為 Siri 升級提供動力,這顯示 Google 的 AI 技術影響力正持續擴大。
